Distilling Structure from Imagery:Graph-based Models for the Interpretation of Document Images
نویسندگان
چکیده
From its early stages, the community of Pattern Recognition and Computer Vision has considered importance leveraging structural information when understanding images. Usually, graphs have been proposed as a suitable model to represent this kind due their flexibility representational power able codify both, components, objects, or entities pairwise relationship. Even though successfully applied huge variety tasks, result symbolic relational nature, always suffered from some limitations compared statistical approaches. Indeed, trivial mathematical operations do not an equivalence in graph domain. For instance, core many pattern recognition applications, there is need compare two objects. This operation, which considering feature vectors defined ℝn, properly for graphs. In thesis, we investigated perspectives, traditional graph-based methods new advances on Geometric Deep Learning. On one hand, explore problem defining representation how deal with it large scale noisy scenario. other Graph Neural Networks are first redefine Edit Distance methodologies metric learning problem, second, apply them real use case scenario detection repetitive patterns define tables invoice documents. As experimental framework, validated different methodological contributions domain Document Image Analysis Recognition.
منابع مشابه
the application of multivariate probit models for conditional claim-types (the case study of iranian car insurance industry)
هدف اصلی نرخ گذاری بیمه ای تعیین نرخ عادلانه و منطقی از دیدگاه بیمه گر و بیمه گذار است. تعین نرخ یکی از مهم ترین مسایلی است که شرکتهای بیمه با آن روبرو هستند، زیرا تعیین نرخ اصلی ترین عامل در رقابت بین شرکتها است. برای تعیین حق بیمه ابتدا می باید مقدار مورد انتظار ادعای خسارت برای هر قرارداد بیمه را برآورد کرد. روش عمومی مدل سازی خسارتهای عملیاتی در نظر گرفتن تواتر و شدت خسارتها می باشد. اگر شر...
15 صفحه اولthe underlying structure of language proficiency and the proficiency level
هدف از انجام این تخقیق بررسی رابطه احتمالی بین سطح مهارت زبان خارجی (foreign language proficiency) و ساختار مهارت زبان خارجی بود. تعداد 314 زبان آموز مونث و مذکر که عمدتا دانشجویان رشته های زبان انگلیسی در سطوح کارشناسی و کارشناسی ارشد بودند در این تحقیق شرکت کردند. از لحاظ سطح مهارت زبان خارجی شرکت کنندگان بسیار با هم متفاوت بودند، (75 نفر سطح پیشرفته، 113 نفر سطح متوسط، 126 سطح مقدماتی). کلا ...
15 صفحه اولdeveloping a pattern based on speech acts and language functions for developing materials for the course “ the study of islamic texts translation”
هدف پژوهش حاضر ارائه ی الگویی بر اساس کنش گفتار و کارکرد زبان برای تدوین مطالب درس "بررسی آثار ترجمه شده ی اسلامی" می باشد. در الگوی جدید، جهت تدوین مطالب بهتر و جذاب تر، بر خلاف کتاب-های موجود، از مدل های سطوح گفتارِ آستین (1962)، گروه بندی عملکردهای گفتارِ سرل (1976) و کارکرد زبانیِ هالیدی (1978) بهره جسته شده است. برای این منظور، 57 آیه ی شریفه، به صورت تصادفی از بخش-های مختلف قرآن انتخاب گردید...
15 صفحه اولLayout Based Information Retrieval from Document Images
This research is intended to develop a layout based retrieval system for document image databases consisting of three phases: 1. At first, intelligent layout analysis algorithm has been designed to extract the layouts the document images physically with their edges and rectangles. 2. Every physically identified layout has been converted into a tree intermediary representation for indexing and s...
متن کاملGeometric Structure Analysis of Document Images: A Knowledge-Based Approach
ÐGeometric structure analysis is a prerequisite to create electronic documents from logical components extracted from document images. This paper presents a knowledge-based method for sophisticated geometric structure analysis of technical journal pages. The proposed knowledge base encodes geometric characteristics that are not only common in technical journals but also publication-specific in ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Electronic Letters on Computer Vision and Image Analysis
سال: 2021
ISSN: ['1577-5097']
DOI: https://doi.org/10.5565/rev/elcvia.1313